from pyparsing import unichr


def strQ2B(ustring):
    """全角转半角"""
    rstring = ""
    for uchar in ustring:
        inside_code = ord(uchar)
        if inside_code == 12288:  # 全角空格直接转换
            inside_code = 32
        elif 65281 <= inside_code <= 65374:  # 全角字符（除空格）根据关系转化
            inside_code -= 65248

        rstring += unichr(inside_code)
    return rstring

print(strQ2B("TF－IDF由两部分组成：词频（ＴＦ）指的是某一个特定的词语在该文本中出现的频率；逆文档频率（ＩＤＦ）即文本数量与某一个特定的词语在文本集中出现的次数的比值。"))
